点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
随着AI系统解决越来越具有挑战性的问题,人类将其答案验证为安全,有用和准确的问题将变得更加困难。例如,确认对研究生级物理问题的解决方案需要领域的专业知识,评估文献需要大量时间,并且在代码中确定种族条件需要仔细的推理,所有人类在实际的时间和资源约束下都可能与之斗争。由于现有的AI一致性和监督方法取决于可靠的人类监督,因此我们将需要新的互动机制和培训协议来进行可扩展的监督(Amodei等人,2016年;鲍曼等。,2022),即随着最先进的AI模型执行的任务的复杂性的增加而扩展。
主要关键词